올해도 어김없이 휴가철이 돌아왔다.. 사람들은 어디로 많이 놀러갈까???

그리고 어떤 곳이 '7말8초'에 인기있는 휴양지라고 할 수 있을까??..

내가 생각해본 휴가철 인기 휴양지란..

기준 : 비휴가철 교통량대비 휴가철 교통량이 대폭 증가한 톨게이트 근처에 인기 휴양지가 있다

한계 : 고속도로를 이용 하지 않거나 기차를 이용하는 휴양객들의 동향은 파악 불가

1. 분석을 위해 필요한 데이터 (2020년 2, 3 분기) 데이터 다운로드 및 병합

교통 > 교통량(TCS)

1.의 결과 준비된 데이터

* 1종~6종 교통량이 의미하는 차종은 아래 그림과 같다.

2. 분석 목적에 맞추어 데이터 전처리

  1. 분석에 필요하다고 생각되는 '집계일자', '영업소명', '입출구명', '1종교통량' 데이터를 추출
  2. '집계일자', '영업소명'이 같은 행에 대해 '1종교통량' 값을 합산
  3. '집계일자'가 휴일인지 평일인지 알려주는 '평/휴일' 열 추가

    사용된 코드는 <코드 보기> 기능을 이용하면 확인 가능합니다!

2.의 결과 데이터가 다음과 같이 가공됨

3. 여름 휴가철의 기간은 어떻게 설정할지 고민해보자

2020년 4월부터 9월까지 평일에 공휴일인 날은

  1. 4월 15일 수요일 (21대 국회의원 선거)
  2. 4월 30일 목요일 (석가탄신일)
  3. 5월 5일 화요일 (어린이날)
  4. 8월 17일 월요일 (광복절 임시공휴일)
  5. 9월 30일 수요일 (추석연휴)

결론..

  • 5월 5일 어린이날과 9월말 추석연휴 전후로 교통량이 급증하므로, 가지고 있는 데이터 중 5월 11일 (월)~ 9월 23일 (수) 까지의 데이터만 사용하기로 결정
  • 8월 17일 임시공휴일을 고려, 여름 휴가철의 기간을 7월 31일 (금) ~ 8월 23일 (일) 까지로 설정
  • 5월 11일 ~ 7월 30일 : 비휴가철
  • 7월 31일 ~ 8월 23일 : 휴가철
  • 8월 24일 ~ 9월 23일 : 비휴가철

4. 비휴가철 대비 휴가철의 교통량 상승률을 구하기 위한 데이터 가공

  1. 5월 11일 (수) ~ 9월 23일 (수) 까지의 데이터만 추출
  2. '집계일자'가 비휴가철에 해당하는지, 휴가철에 해당하는지 알려주는 '휴가철' 열 생성
  3. 비휴가철의 1종교통량 평균을 구하여 '비휴가철 평균교통량' 열 생성
  4. 휴가철의 교통량이 비휴가철 대비 얼마나 상승한지 알려주는 '비휴가철 대비 증감률' 열 생성

    사용된 코드는 <코드 보기> 기능을 이용하면 확인 가능합니다!

4.의 결과 데이터가 다음과 같이 가공됨

5. 영업소의 교통량 변동 추이를 그래프로 확인해보자

5-1. 휴가철 교통량이 603% 상승한 '석곡' 톨게이트의 기간내 교통량 변동 추이

5-2. 휴가철 교통량이 99% 감소한 '금강' 톨게이트의 기간내 교통량 변동 추이

6. 데이터 시각화

6-1. 네이버 지도 api한국도로공사의 영업소 도로명주소 를 활용하여 영업소의 위치정보(위도, 경도)를 얻자

6-2. folium 라이브러리를 이용한 시각화

  • 비휴가철 대비 교통량이 25% 이상 증가한 51개의 영업소 중, 상위 20개의 영업소의 다수가 전라남도강원도에 집중되어 있는 것을 확인할 수 있다.
  • 동해안 해안지방, 강원도 산간지방, 전라남도 산간지방이 휴양객들에게 선호도가 높으며,
  • 지도에 표시된 다른 곳도 모두 인기 있는 곳이니 해당 지역근처에 즐길거리를 검색하여 방문하면 실패없이 좋은 휴가를 보낼수 있을 것 같다!

올해 휴가철은 이미 지나갔지만 2021년 데이터가 공개되면,

2021년 분석도 업로드 할 예정이니 내년 휴가철에는 재밌게 놀아보자